智能论文笔记

Accelerating Neural Network Inference with Processing-in-DRAM: From the Edge to the Cloud

Geraldo F. Oliveira , Juan Gómez-Luna , Saugata Ghose , Amirali Boroumand , Onur Mutlu

分类：机器学习

2022-09-19

神经网络（NNS）的重要性和复杂性正在增长。神经网络的性能（和能源效率）可以通过计算或内存资源约束。在内存阵列附近或内部放置计算的内存处理（PIM）范式是加速内存绑定的NNS的可行解决方案。但是，PIM体系结构的形式各不相同，其中不同的PIM方法导致不同的权衡。我们的目标是分析基于NN的性能和能源效率的基于DRAM的PIM架构。为此，我们分析了三个最先进的PIM架构：（1）UPMEM，将处理器和DRAM阵列集成到一个2D芯片中；（2）Mensa，是针对边缘设备量身定制的基于3D堆栈的PIM架构；（3）Simdram，它使用DRAM的模拟原理来执行位序列操作。我们的分析表明，PIM极大地受益于内存的NNS：（1）UPMEM在GPU需要内存过度按要求的通用矩阵 - 矢量乘数内核时提供23x高端GPU的性能；（2）Mensa在Google Edge TPU上提高了3.0倍和3.1倍的能源效率和吞吐量，用于24个Google Edge NN型号；（3）SIMDRAM在三个二进制NNS中以16.7倍/1.4倍的速度优于CPU/GPU。我们得出的结论是，由于固有的建筑设计选择，NN模型的理想PIM体系结构取决于模型的独特属性。

translated by 谷歌翻译

Improved Relation Networks for End-to-End Speaker Verification and Identification

Ashutosh Chaubey , Sparsh Sinha , Susmita Ghose

分类：机器学习

2022-03-31

在现实世界中，扬声器身份系统的任务是在一组注册的扬声器中识别出一个只有几个注册扬声器的示例中的扬声器。本文展示了该用例的元学习和关系网络的有效性。我们提出了改进的关系网络，用于说话者验证和很少的射击者（看不见）的说话者识别。关系网络的使用促进了前端扬声器编码器和后端模型的联合培训。受到使用典型网络在扬声器验证中使用原型网络并增加说话者嵌入的可区分性的启发，我们训练该模型以在训练集中存在的所有扬声器中对当前情节进行分类。此外，我们通过从给定的元学习插曲中提取更多信息，并提出一种新的培训方式，以使用可忽略不计的额外计算，从而提出了更快的模型收敛性。我们在Voxceleb，SITW和VCTK数据集上评估了有关说话者验证的任务和看不见的说话者识别的提议技术。所提出的方法在这两个任务上始终如一地优于现有方法。

translated by 谷歌翻译

Degrees of Freedom Analysis of Mechanisms using the New Zebra Crossing Method

Rajashekhar V S , Debasish Ghose

分类：机器人

2022-01-07

移动性，这是必须分析机制的基本属性，以找到自由度。在这项工作中提出了一种快速计算机制中自由度的方法。该机制以类似于斑马交叉的方式表示。提出了一种算法，用于确定斑马线交叉图的移动性。该算法考虑了黑色斑块之间的贴片数，连接到固定链路的接头数以及机制中的循环数。已经讨论了许多案例，其未使用广泛使用的古典Kutzbach-Grubler公式提供所需的结果。

translated by 谷歌翻译

UAV Formation Preservation for Target Tracking Applications

Aditya Hegde , Jasmine Jerry Aloor , Debasish Ghose

分类：机器人

2021-12-06

本文介绍了具有多种试剂的协同目标跟踪应用，以及具有所需的代理距离和指定界限的代理形成问题。我们提出了一种基于障碍的障碍基于障碍的分布式控制定律，以保留目标跟踪的形成，并使用运动模型评估其稳定性。提出了使用该模型的数值结果，以证明所提出的控制对基于二次Lyapunov功能的控制的优点。提出了使用实验ROS模拟的结论评估，以说明所提出的控制方法对多转子系统的适用性和执行直线和圆周运动的目标。

translated by 谷歌翻译

Generalizable Cross-Graph Embedding for GNN-based Congestion Prediction

Amur Ghose , Vincent Zhang , Yingxue Zhang , Dong Li , Wulong Liu , Mark Coates

分类：机器学习 | 人工智能

2021-11-10

目前有技术节点缩放，早期设计阶段的精确预测模型可以显着降低设计周期。特别是在逻辑合成期间，预测由于逻辑组合不当导致的细胞拥塞可以减少后续物理实现的负担。已经尝试使用图形神经网络（GNN）技术来解决逻辑合成阶段的拥塞预测。然而，它们需要信息性小区特征来实现合理的性能，因为GNN的核心概念构建在消息通过框架上，这在早期逻辑合成阶段将是不切实际的。为了解决这个限制，我们提出了一个框架，可以直接学习给定网表的嵌入式，以提高节点功能的质量。基于流行的随机播放的嵌入方法，如Node2VEC，LINE和DeadWalk遭受横绘对齐和普遍性的问题，以取消差价，效率低于性能和成本耗费的运行时。在我们的框架中，我们介绍了一种卓越的替代方案，可以获得可以使用矩阵分解方法概括在网表图中的节点嵌入。我们在子图水平上提出了一种高效的迷你批量培训方法，可以保证并行培训并满足大规模网手册的内存限制。我们呈现利用开源EDA工具的结果，如Dreamplace和OpenORAD框架上的各种公开的电路。通过将学习的嵌入在网手册的顶部与GNN结合，我们的方法可以提高预测性能，推广到新电路线，并且在训练中具有高效，潜在节省超过$ 90 \％运行时。

translated by 谷歌翻译

Autonomous Cooperative Multi-Vehicle System for Interception of Aerial and Stationary Targets in Unknown Environments

Lima Agnel Tony , Shuvrangshu Jana , Varun V. P. , Aashay Anil Bhise , Aruul Mozhi Varman S. , Vidyadhara B. V. , Mohitvishnu S. Gadde , Raghu Krishnapuram , Debasish Ghose

分类：机器人

2021-09-01

本文介绍了设计，开发，并通过IISC-TCS团队为穆罕默德·本·扎耶德国际机器人挑战赛2020年挑战1的目标的挑战1硬件 - 软件系统的测试是抓住从移动和机动悬挂球UAV和POP气球锚定到地面，使用合适的操纵器。解决这一挑战的重要任务包括具有高效抓取和突破机制的硬件系统的设计和开发，考虑到体积和有效载荷的限制，使用适用于室外环境的可视信息的准确目标拦截算法和开发动态多功能机空中系统的软件架构，执行复杂的动态任务。在本文中，设计了具有末端执行器的单个自由度机械手设计用于抓取和突发，并且开发了鲁棒算法以拦截在不确定的环境中的目标。基于追求参与和人工潜在功能的概念提出了基于视觉的指导和跟踪法。本工作中提供的软件架构提出了一种操作管理系统（OMS）架构，其在多个无人机之间协同分配静态和动态任务，以执行任何给定的任务。这项工作的一个重要方面是所有开发的系统都设计用于完全自主模式。在这项工作中还包括对凉亭环境和现场实验结果中完全挑战的模拟的详细描述。所提出的硬件软件系统对反UAV系统特别有用，也可以修改以满足其他几种应用。

translated by 谷歌翻译

Learning Interpretable Models Using an Oracle

Abhishek Ghose , Balaraman Ravindran

分类：机器学习 | (统计)机器学习

2019-06-17

我们查看模型可解释性的特定方面：模型通常需要限制在大小上才能被认为是可解释的，例如，深度5的决策树比深度50中的一个更容易解释。但是，较小的模型也倾向于高偏见。这表明可解释性和准确性之间的权衡。我们提出了一种模型不可知论技术，以最大程度地减少这种权衡。我们的策略是首先学习甲骨文，这是培训数据上高度准确的概率模型。 Oracle预测的不确定性用于学习培训数据的抽样分布。然后，对使用此分布获得的数据样本进行了可解释的模型，通常会导致精确度明显更高。我们将抽样策略作为优化问题。我们的解决方案1具有以下关键的有利属性：（1）它使用固定数量的七个优化变量，而与数据的维度（2）无关，它是模型不可知的 - 因为可解释的模型和甲骨文都可能属于任意性模型家族（3）它具有模型大小的灵活概念，并且可以容纳向量大小（4）它是一个框架，使其能够从优化领域的进度中受益。我们还提出了以下有趣的观察结果：（a）通常，小型模型大小的最佳训练分布与测试分布不同；（b）即使可解释的模型和甲骨文来自高度截然不同的模型家族，也存在这种效果：我们通过使用封闭的复发单位网络作为甲骨文来提高决策树的序列分类精度，从而在文本分类任务上显示此效果。使用字符n-grams；（c）对于模型，我们的技术可用于确定给定样本量的最佳训练样本。

translated by 谷歌翻译

DeepProcess: Supporting business process execution using a MANN-based recommender system

Asjad Khan , Hung Le , Kien Do , Truyen Tran , Aditya Ghose , Hoa Dam , Renuka Sindhgatta

分类：神经与进化计算

2018-02-03

进程感知的推荐系统可以提供关键的决策支持功能，以帮助通过推荐接下来采取的操作来执行业务流程执行。基于深度学习领域的最近进步，我们介绍了一种基于新的内存增强神经网络（MANN）构建过程感知推荐系统。我们提出了一种新颖的网络架构，即写保护的双控制器存储器增强神经网络（DCW-MANN），用于构建规范模型。为了评估我们方法的可行性和有用性，我们考虑了三个现实世界数据集，并表明我们的方法在后缀推荐和下一个任务预测任务的几个基线上导致更好的性能。

translated by 谷歌翻译